群体遗传结构 单倍型
----群体遗传学-------------
----单倍型分析
dnasp
MEGA
PopART
perl /share/nas6/xul/program/chloroplast/Haplotype/get_nex_with_aln_fasta_and_location_for_network.pl -h
mafft --auto --thread 30 allsample.fa > allsample.fa.aln
----fst
dnasp
arlequin
----分歧时间
进化树 外群
----分子方差分析
arlequin
AMOVA&FST
见文件AMOVA&FST/result.xml
1.用mafft比对序列,得到.fasta文件(几个群体之间) 3816项目分两次
2.将原始FASTA格式的序列文件载入DnaSP后,
点击菜单栏“Data”的“Format”,修改一些信息
点击菜单栏“Data”的“Defined Seeuence sets”对序列根据特定的性状进行分组(图1),示例数据根据地区分组,分组完毕 “Update All Entries”。
3.随后,依次点击菜单栏“Generate”->“Haplotye data file”将分组后的数据生成“Arlequin Haplotype List”文件,生成Test.arp和Test.hap 两个文件,Test.arp用Arlequin的方案文件,Test.hap为单倍型数据文件。
4.将.arp导入Arlequin软件
4.1标签切换到“Structure Edior”对不同地区的群体进行归组,示例数据的不同群体均为一个组,故“Group”均设置为“1”,并点击“Update Project”更新项目分组内容
4.2点击Structure Editor,改一下Group,可以把一个种设为一个组,也可以按照采样的省分组,也可以只分为一个组,就把0全部改为1
5.计算amova等,结果为.xml格式
Haplotype_Network
见文件夹Haplotype_Network
1.用mafft比对序列,得到.fasta文件
2.将原始FASTA格式的序列文件载入DnaSP后,
点击菜单栏“Data”的“Format”,修改一些信息
点击菜单栏“Data”的“Defined Seeuence sets”对序列根据特定的性状进行分组(图1),示例数据根据地区分组,分组完毕 “Update All Entries”
3.随后,依次点击菜单栏“Generate”->“Haplotye data file”将分组后的数据生成单倍型.nex文件
修改.nex文件,
MATRIX
Hap_1
末尾添加Begin Traits; 添加分组
Begin Traits;
Dimensions NTraits=4;
Format labels=yes missing=? separator=Comma;
TraitLatitude 0 0 0 0;
TraitLongitude 0 0 0 0;
TraitLabels G J L S;
Matrix
Hap_1 1,0,0,0
Hap_2 0,1,0,0
Hap_3 0,0,1,0
Hap_4 0,0,0,1
;
End;
4.上一步的.nex文件导入PopART软件,选择Network-TCSnetwork,画图,edit选项下修改颜色
xul版已验证
cd 5.samples_hap_network
# 纯windows操作,可以参考https://blog.sciencenet.cn/blog-460481-1191502.html
1.使用mafft对齐序列,注意所有序列方向都要相同
mafft --quiet --auto *.fasta > all.aln.fa
2.准备文件group.txt、location.xls
# 分组信息(没有可以省略),第一列为分组名称(地理、品种),第二列为序列名称
P1 s1
P1 s2
P1 s3
P2 s4
P2 s5
P2 s6
P3 s7
P3 s8
P4 s9
P4 s10
P4 s11
P4 s12
P5 s13
# 地理位置信息(没有可以省略),第一列为分组名称,第二列为经度信息(西经前面加负号),第三列为维度信息(南纬前面加负号)
P1 90.13431 30.45147
P2 112.2452 28.13414
P3 105.4134 30.14362
P4 100.3332 25.12222
P5 108.2434 22.42234
3.生成popart配置文件
1)没有分组信息的,将每条序列当成一个分组
cp_get_nex_with_aln_fasta_for_network.pl -aln ycf1.aln.fa
# 结果:
# hap.fa :单倍型序列文件
# hap.nex: nex格式文件,用于输入popart软件
# hap.xls:单倍型统计结果
2)有分组信息的
#cp_get_nex_with_aln_fasta_for_network.pl -aln ycf1.aln.fa -group group.txt
perl /share/nas1/yuj/program/cp_advanced_class/chloroplasty/script/cp_get_nex_with_aln_fasta_for_network.pl -aln *.aln.fa -group group.txt
# 结果:
# 新增结果 hap_group.xls:不同组单倍型情况
3)有分组经纬度信息的
cp_get_nex_with_aln_fasta_for_network.pl -aln ycf1.aln.fa -group group.txt -location location.xls
# 结果:
# 结果和上述相同,但是nex文件中包含了单倍型信息
4.使用popart软件导入nex信息,绘图
# 单倍型网络
# File->open->nex文件->Network->TCS Network->调整图形->File->Export graphics->选择svg格式
上传服务器之后,碰到svg转换不了,以文本形式打开svg,把“<svg”标签内容放在一行,不要多行,会被识别为未闭合。
# 地理分布
# File->open->nex文件->View->Switch to network view->Map theme->Atlas->File->Export graphics->选择svg格式
# 注:nex文件放在纯英文路径的文件夹中,或者放到盘符根目录下,不然可能会识别不了。